Národní úložiště šedé literatury Nalezeno 6 záznamů.  Hledání trvalo 0.00 vteřin. 
Derivační morfologie češtiny na základě rozsáhlých korpusových dat
Faltusová, Marie ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Tématem této práce je zkoumání slovotvorby v českém jazyce. Hlavním cílem je vytvořit modul získávající derivace z dat elektronického Slovníku spisovné češtiny. Tato problematika byla vyřešena sestrojením tříúrovňového zpracování vycházejícího z dat slovníku. První úrovní je získání derivací z definic lemmat, druhým krokem je seskupení základních tvarů podle jejich podobností a třetí fází je ohodnocení získaných derivačních dvojic značkou derivační třídy, do které spadají. Zpracováním se podařilo získat více než 4 500 nových slov a ohodnotit nad 20 000 derivačních vazeb. Modul se stal plnohodnotnou součástí Morfologického analyzátoru Výzkumné skupiny znalostních technologií, působící na Fakultě informačních technologií Vysokého učení technického v Brně.
Morphological Segmentation in Czech using Word-Formation Network
Bodnár, Jan ; Žabokrtský, Zdeněk (vedoucí práce) ; Hana, Jiří (oponent)
Morfologická segmentace se zabývá dělením slov na morfémy - nejmenší jednotky nesoucí význam. Jedná se o nízkoúrovňový problém z oblasti zpracování přirozeného jazyka. Jelikož se morfologická segmentace někdy používá jako metoda předzpracování dat, její zlepšení může pomoci algoritmům řešícím nejrůznější problémy z oblasti NLP, zejména, pokud v situaci, kdy je nedostatek dat. Zlepšení morfologické segmentace může také pomoci lingvistickému výzkumu, využívajícímu korpusy. V této práci navrhujeme nový ensemble algoritmus pro morfologickou segmentaci Českých lemmat, který používá derivační stromy z datasetu DeriNet. Zároveň vytváříme návrhy na zlepšení tohoto datasetu.
Morphological segmentation of Czech Words
Vidra, Jonáš ; Žabokrtský, Zdeněk (vedoucí práce) ; Mareček, David (oponent)
V lingvistice se obvykle slova považují za složená z morfémů, což jsou dále neděli- telné jazykové jednotky nesoucí význam. Zadáním této práce je nalézt automatickou metodu dělení českých slov na morfémy, které by bylo možné přidat do DeriNetu, sítě derivačních vztahů mezi českými slovy. Vytvořili jsme dvě různé takové metody. První nalézá hranice morfémů na zá- kladě hledání rozdílů mezi slovem a jeho derivačním předkem, a tranzitivně mezi všemi slovy v derivačním hnízdě. Tato metoda explicitně modeluje hláskové a mor- fologické alternace a nalézá nejvhodnější hranice morfémů pomocí metody maximál- ní věrohodnosti. Ve srovnání s moderním systémem Morfessor FlatCat naše metoda přinejhorším mírně zaostává, ovšem v některých testech naopak dosahuje výsledků výrazně lepších. Druhou metodou je neuronová síť pro současné předpovídání morfologické seg- mentace a derivačních předků, trénovaná na datech získaných první metodou a na de- rivačních vztazích ze sítě DeriNet. S naší hypotézou, že tento způsob trénování dvou úloh naráz pomůže k dosažení lepších výsledků oproti trénování samotné segmenta- ce, jsou však ve shodě pouze některé provedené pokusy. Celkově dosahuje neuronová síť horších výsledků než první metoda, pravděpodobně kvůli trénování na datech ob- sahujících chyby, které se tím přidávají k chybám...
Derivační morfologie češtiny na základě rozsáhlých korpusových dat
Faltusová, Marie ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Tématem této práce je zkoumání slovotvorby v českém jazyce. Hlavním cílem je vytvořit modul získávající derivace z dat elektronického Slovníku spisovné češtiny. Tato problematika byla vyřešena sestrojením tříúrovňového zpracování vycházejícího z dat slovníku. První úrovní je získání derivací z definic lemmat, druhým krokem je seskupení základních tvarů podle jejich podobností a třetí fází je ohodnocení získaných derivačních dvojic značkou derivační třídy, do které spadají. Zpracováním se podařilo získat více než 4 500 nových slov a ohodnotit nad 20 000 derivačních vazeb. Modul se stal plnohodnotnou součástí Morfologického analyzátoru Výzkumné skupiny znalostních technologií, působící na Fakultě informačních technologií Vysokého učení technického v Brně.
Prefixace v současné španělštině
Řepíková, Kamila ; Čermák, Petr (vedoucí práce) ; Kratochvílová, Dana (oponent)
Předložená diplomová práce se komplexně zabývá otázkou prefixace v současné španělštine, proto je rozdělená na dvě části. V té první se pohybujeme na poli konstrukční morfologie a věnujeme se teoretickým otázkám. Od obecnějších témat tvorby slov se přesouváme k samotné prefixaci, kterou se pak snažíme charakterizovat a popsat do větších detailů. Nastiňujeme problémy vymezení konceptů, definice prefixace, klasifikace prefixů a další kontroverzní otázky spojené s tímto procesem ve španělském jazyce. Druhá část práce je pak praktičtější povahy. Soustředíme se na sémantické významy (lokativní a gradativní), kterých mohou některé prefixy nabývat. Následně se pak zaměřujeme na konkrétní předpony (entre-, inter-, sobre-, super-), jejich distribuci mezi slovními druhy a na konec za pomoci paralelního jazykového korpusu InterCorp zkoumáme české protějšky námi předem zvolených prvků.
Multigramatiky a syntaktická analýza založená na nich
Fiala, Jiří ; Lukáš, Roman (oponent) ; Meduna, Alexandr (vedoucí práce)
Úkolem této práce je seznámení s pragmaticky orientovaným výzkumem na poli teoretické informatiky a prezentovat návrhy aplikačních metod pro zvolené tematické oblasti. Konkrétní prostředek teoretické informatiky je reprezentován druhem generativního systému - multigramatikou a jednotlivé aplikační oblasti jsou zde zvoleny vzhledem k možnostem, které multigramatiky nabízí. V návaznosti na poznatky dosažené Thompsonem (viz [9]), Lindenmayerem  (viz [26]), Mandelbrotem (viz [8]) ale i výsledky ze studií dosažených Morneauem (viz [17]), které poukazují na souvislosti mezi přírodními zákonitostmi a matematickou disciplínou, zkoumáme aplikace multigramatik z pohledu dvou tematických oblastí: generativních L-systémů (zahrnuje dále aplikace z fraktálové grafiky a biomatematiky) a zpracování jazyků přirozených (zahrnuje dále návrh vhodného abstraktního jazyka). Zmíněny jsou také otázky společné s oblastí návrhu překladačů.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.